首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏创作是最好的自我投资

    AI时代,存 or 哪个更重要

    然而,在AI技术如此迅猛发展的今天,我们不禁要问:究竟是还是存储能力,是推动AI技术飞速发展的关键核心呢?,即计算能力,是指在进行数学运算、逻辑运算以及数据处理等操作时所具备的计算效能。 在云计算环境下,面对海量的数据库,需要强大的来高效执行诸如数据挖掘、机器学习模型训练等复杂任务,这涉及到大规模矩阵运算、深度神经网络的前向传播与反向传播计算等,对的要求极高。 总的来说至此,我们能够清楚地认识到,存对于AI技术的发展而言,有着同等的重要意义。若缺乏AI就会失去从海量数据里迅速挖掘有效信息的能力,这就好比轮船没有了驱动自身向前航行的螺旋桨一样。 从另一方面来说,要是没有存AI发展所依存的海量数据就没有地方存放。一旦失去数据这个支撑,AI就如同轮船脱离了能够航行的海水,最终只能停滞在原地,无法前行。 总的来说,AI技术的快速发展就像鸟儿飞翔需要一双有力的翅膀一样,绝对离不开存这两者如同双翼般的支撑。这就如同行人在进行长途跋涉时,必须要依靠双脚的力量一样,缺一不可。

    46820编辑于 2025-01-12
  • 来自专栏IT创事记

    AI催生供给侧变革

    面对数据呈指数级增长的趋势,很多行业都开始大规模利用HPC和AI,希望借此提升企业的预见性和决策,在激烈的市场竞争中脱颖而出。 需求端的红火固然可喜,但有效的供给难免出现结构性短缺的问题。对应的产品、服务和解决方案,与客户需求之间时常存在错配现象。人们期待HPC和AI的供给侧,也能来一场轰轰烈烈的变革。 发生供给侧变革 身处HPC和AI的风口浪尖,很多设备商和服务商已经感受到了供给的痛点,积极进行相关的战略布局和产品研发。 改变世界 到底是如何改变世界的呢?再回到本文开头提到的零售业——这是人们日常生活中最容易触摸到的行业,其演变轨迹处处闪现着的魔力。 强大的正在改变零售业,改造所有传统行业,最终也将创建一个全新的世界。

    46620编辑于 2022-08-30
  • 来自专栏智能相对论

    形态进化后,AI能解开数据科学团队的桎梏吗?

    几乎所有AI场景对的需求都在加速膨胀,过去一些年,市面上能够提供给数据科学团队的形态,在一定的条件下都未必能很好地满足需要,尤其是主流的基于CPU的庞大数据中心,在计算能力上离支撑快速迭代要求的水准还有较大差距 而在具体场景中,很多组织也在通过AI获得。 可以看到,AI正在满足不同类型组织中的数据科学团队需要。 除了AI 还将解决数据团队的“要素配置”难题? 小结 如同PC的发展,从一间房到半张桌,从KB到GB到TB,从专业团队操作到人人可用,AI设备也在经历类似的过程,高能力、低门槛,优质资源正在实现更好的触达,让组织的数据科学团队更好地获取匹配的 AI成为了AI应用创新的起点,但它也是AI应用落地的结果,市场需求始终“水涨船高”,形态的进化,还将继续。

    1.4K30发布于 2021-07-22
  • 来自专栏科技云报道

    “大建设”时期,AI何去何从?

    就是生产,得者得天下。 随着新一代人工智能技术的快速发展和突破,以深度学习计算模式为主的AI需求呈指数级增长。 毕竟,在人工智能发展的三要素:数据、算法和中,无论是数据还是算法,都离不开的支撑。 那么,AI从哪来? AI进入“大建设”时期 AI对于提升国家、区域经济核心竞争的重要作用已经成为业界共识。 近年来,随着“东数西”工程的启动以及智中心的建设,从国家层面实现有效的资源结构整合,目前全国已有8地启动建设国家枢纽节点,并规划了10个国家数据中心集群,以推进集约化、绿色节能、安全稳定的基础设施的建设 在AI产业化、产业AI化和政府治理智能化等需求的驱动下,我国AI蓬勃发展。

    47630编辑于 2023-02-14
  • 来自专栏新智元

    即王道!千亿级AI大模型,没有「网」怎么行?

    ---- 新智元报道 编辑:好困 yaxin 【新智元导读】就是生产,得者得天下。千亿级参数AI模型预示着大爆炸时代来临,不如织起一张「网」试试? 得者得天下。 通过自动混合并行模式实现了在2048卡集群上的大规模分布式训练。 在预训练阶段,模型学习了40TB中文文本数据,并通过行业数据的样本调优提升模型在场景中的应用性能。 随着人工智能模型的逐渐成熟,以及各个行业的智能化转型,越来越多的企业都体验到了AI带来的便捷。 AI的应用必定会涉及到的需求,然而让每个企业都去搭建「人工智能计算中心」显然是不现实的。 然而,中国科学技术信息研究所在《人工智能计算中心发展白皮书》里指出,目前我国在人工智能计算中心的发展上遇到的一个重要的问题是: 不管是作为AI芯片,还是实现算法的模块化封装的AI开发框架,95%以上都被外国的公司所垄断 人工智能计算中心具有了训练、推理能力以及供AI开发的平台,自然也就有了能够向外输出的强大了。 那么问题又来了,建设这么一堆人工智能计算中心就够了么? 不如把连成「网络」?

    2K60发布于 2021-10-12
  • 来自专栏科技云报道

    “吞金兽”ChatGPT背后:AI告急!

    AI霸权时代的到来 模型需求增速超越芯片性能增速,霸权时代或将到来。 因此,AI训练模型需求增长与芯片计算性能增长之间的不匹配,或将带来对基础设施供给需求的快速增长。 考虑到对于AI模型训练效果的关键性作用,拥有更丰富资源的模型开发者,或将能够训练出更优秀的AI模型。 所以现在有一种说法:AI进入了新的霸权时代,大家要用千倍、万倍的才能训练出世界上最好的算法。 那么无论是谁参与进来,都需要回答一个问题:成本怎么解决? 对于AI产业来说,“东数西”也可以成为“东数西训”,即庞大的训练需求完全可以转移到成本更低,同时规模更具优势的西部数据中心中进行。

    1.5K90编辑于 2023-02-23
  • 来自专栏人工智能头条

    如何提升AI?他们这样说......

    7 月 21 日,“决胜算时代 ”AI 高端闭门分享会在北京天使汇极客咖啡举办。本次分享会由 CSDN 发起,由 CTO 俱乐部,深脑链、AI 科技大本营和区块链大本营协办。 分享会从 AI 的现状和趋势谈起,并从硬件设计和算法优化两个层面切入,剖析提升的最新落地经验和误区,最后针对成本居高不下的普遍现状,引入的新型协作方式---借用区块链生态的分布式协作,大幅降低企业成本 AutoML 的整个过程需要大量的计算,它对需求分为两部分,第一部分是本身的模型评估,这与平时模型的训练类似。 由于爆炸增长的 AI 需求是目前制约人工智能发展的主要瓶颈,所以他谈到了区块链如何以分布式协作,将“挖矿”和 AI 训练结合在一起,将汇集闲散的用于 AI 训练中,以及如何将区块链浪费资源的计算转化为高效率的人工智能深度学习 其次区块链在早期很多机器接入进来,除了能够整个生产力系统分配的奖励之外,还可以获得支付的,这两部分组成了一个完整收入,不过这对一个使用的人来说费用其实很少,这就满足了需求和供应两端的需求。

    1.1K10发布于 2018-08-03
  • DeepSeek自研AI芯片,AI新变革?

    AI告急,成本掣肘发展当下,AI技术迅猛发展,从科研领域的复杂模型训练,到日常生活里智能语音助手的实时交互,成了决定AI发展的关键因素。 近年来,已有至少16家国产芯片厂商与DeepSeek展开适配合作,显示其在构建多元生态上已有所布局。 对开发者来说,更高效的模型意味着更低开发成本和更高效率;对企业用户而言,强大的AI性能能为业务创新提供有力支持,提升竞争。 若DeepSeek自研AI芯片成功,将为AI应用提供更高效、经济的支持,推动AI在智能交通、医疗、金融等领域落地,加速各行业智能化升级。不过,该计划尚处早期,还有技术难题待攻克。 但无论如何,DeepSeek这一举措已在AI领域播下极具潜力的“种子”,其未来发展值得持续关注。公众号:之光

    38110编辑于 2025-02-17
  • 来自专栏深度学习与python

    当 GPU 成为主角:解锁 AI 集群中那 85% 的闲置 CPU

    作者 | 棱镜 近年来,全球 AI 规模按接近指数级的幅度增长,GPU 已然是整个数据中心的绝对主角,而 CPU 一般被认为只是承担数据预处理、任务调度和通信协同的次要部分。 如意 (RUE) 的在离线混部技术吸引了行业目光,采用深度改造 Linux 内核调度体系的办法,它可以把 GPU 节点闲置的 CPU、网络、IO、内存资源再次激活,使一台服务器可安全承载两类任务,实现的高效释放 在试点集群里,如意的绝对的抢占机制和跨资源强隔离能力,让 GPU 集群在保障高优任务不受干扰的基础上,释放出大量闲置的 CPU 能力。 在成为基础设施的今天,其价值是无限的。随着 GPU 计算能力的提升,CPU 在训练路径中的占比逐渐下降。但这不意味着 CPU 不重要,相反,CPU 对于实时性、同步性任务的支撑需求反而越来越高。 因此,如意在离线混部的价值不只是体现在节省成本上,更在于对供给方式进行重构,为未来大规模智基础设施打造可靠的基础支撑能力。

    33910编辑于 2025-12-31
  • 来自专栏腾讯云原生团队

    TKE 集群:新一代跨集群混部资源引擎

    引言 在云原生技术席卷千行百业的今天,企业业务早已从单一微服务转向 “在线服务 + AI 训练 + 大数据处理” 的多元形态。 2 新一代资源管理范式,集群 集群是 TKE 面向跨集群资源混部场景推出的首个全栈式产品化解决方案,旨在充分挖掘集群中的闲置,让资源成本迈向全局最优。 2、高优在线类业务的部署和提交模式不变;低优离线类业务通过集群统一运营,基于全局调度为离线业务匹配最合适的,优先级默认最低且资源可抢占。 通过将全局抽象为“已占用”和“可复用”,用户不需再执着于如何将单一业务类型在集群中装得更满,集群可以帮助用户整合多元化业务,让离线任务填补闲置的空缺。 集群主要适用以下场景: 多集群资源割裂:业务分散在不同部门/集群,GPU等昂贵资源跨集群迁移成本高; 潮汐型业务负载:存在在线业务波峰波谷明显(如广告、AI推理),离线任务(数据清洗、模型训练)需填补闲置

    63110编辑于 2025-10-31
  • 来自专栏产品经理的人工智能学习库

    – computation

    文章目录 人工智能里的是什么? 在普通电脑中,CPU就提供了帮助电脑快速运行。玩游戏的时候需要显卡提供,帮助电脑快速处理图形。 而在 人工智能中,需要有类似CPU和GPU的硬件来提供,帮助算法快速运算出结果。 之前在算法里讲过,在制造木桌的过程中,工厂的流水线就是算法。 在那个例子中,工厂中的机器就像,机器越好越先进,制造的过程就越快。 ? 越大,速度越快 维基百科版本 Techpedia版本 是使用计算机技术完成给定目标导向任务的过程。 可以包括软件和硬件系统的设计和开发,用于广泛的目的 – 通常构建,处理和管理任何类型的信息 – 以帮助追求科学研究,制作智能系统,以及创建和使用不同的媒体娱乐和交流。 查看详情 维基百科版本 是使用计算机的任何活动。它包括开发硬件 和软件,以及使用计算机来管理和处理信息,进行交流和娱乐。是现代工业技术的一个至关重要的组成部分。

    2.6K30发布于 2019-12-18
  • 来自专栏新智元

    AI 2027研究揭秘美国真相!中国全球AI专利Top1,但美国或以取胜

    比如,谷歌作为美国最强的公司,也只占全球先进的15%左右(并非全部用于AI研发);OpenAI的占比更是只有5-10%。 而AI竞争的关键,就在于能否将集中投入到特定项目中。 在他们的推演中,中国将在2026年开始集中资源,把15%份额中的10%集中到一个单一的大型AI项目中;而美国的资源则依然处于分散状态。 由于中国的AI项目将占用全球10%的,而美国领先的项目将占用全球15-20%的。 如果AI大爆发要到2030年代才会发生,那么中国就将占据更有利的地位。 全球,美国和美国公司的AI电力 人才 VS 难道AI仅仅取决于吗?当然不是。 通过算法上的突破,即提升构建AI的效率,可以在一定程度上弥补的短板。 但在他们看来,由于算法会受到的制约,即便时通过大量的人才去进行算法创新,终究无法弥补与美国的差距!

    68810编辑于 2025-04-30
  • 来自专栏科技云报道

    之战,英伟达再度释放AI“炸弹”

    在当前生成式AI不断激增的需求下,GH200超级芯片的推出,进一步吹响了AI之战的号角。 一场新的之战已经拉开帷幕,如果说是一个江湖,那么此刻英伟达就是一名绝世高手。 它身怀加速计算的绝技,尤其在AI战场上一骑绝尘,似乎每一次都能精准地踏在浪潮的节奏上。 从游戏PC市场、到深度学习的崛起、到云计算的普及、再到生成式AI的降临,英伟达的技术所向披靡。 回头看,英伟达早已超越了GPU本身的概念,AI成为最大的标签,的绝世武功撑起了新的万亿帝国。 换言之,在他看来,AI江湖已经是GPU的主场。 围绕着的权力游戏还将继续。 【科技云报道原创】

    35120编辑于 2023-08-18
  • 来自专栏大语言模型,算力共享

    共享:环形结构的分配策略

    ​目录共享:环形结构的分配策略方法签名方法实现注意事项nodes.sort(key=lambda x: (x[1].memory, x[0]), reverse=True)end = round (start + (node[1].memory / total_memory), 5)共享:环形结构的分配策略这段代码定义了一个名为RingMemoryWeightedPartitioningStrategy 这种策略可能用于分布式系统或集群管理中,以便更好地平衡工作负载和资源利用率。 topology: Topology: 方法的输入参数,代表集群或系统的拓扑结构。这里假设Topology是一个包含系统中所有节点的容器,并且每个节点具有内存大小等属性。 由于使用了浮点数运算,可能存在微小的精度误差,这在处理大规模集群时可能需要注意。此策略假设节点的内存大小是固定的,不考虑动态变化的情况。在实际应用中,如果节点的内存大小会变化,可能需要定期重新分区。

    90820编辑于 2024-07-26
  • 来自专栏机器之心

    玩大模型,如何越过AI门槛

    现在,AI 服务器厂商宁畅(Nettrix)推出了「畅快」计划,面向互联网、教育、科研、金融等重点行业需要 AI 的企业和机构,提供价值百万的免费 AI 试用活动。 该计划旨在打造便捷的 AI 平台,让更多有需求的行业用户可以流畅、快速地试用体验 AI 。 该平台基于宁畅 AI 服务器打造,NVIDIA 则为开发者准备了基础应用场景和技术支持、工具包。 在管理部署层面,宁畅可为用户提供稳定灵活的支持,以池化,弹性扩容,充分提升利用率。此外,宁畅还能够实现集群部署,按需调整,以集群水平支持大应用。 解决方案,降低 AI 门槛,让 AI 创新、创业更为方便。 面对上百亿、千亿乃至万亿规模的训练参数,如何构建符合自身业务特点和需求的 AI 平台,进行计算资源的合理配置,让真正转化为生产

    94130编辑于 2023-04-21
  • 来自专栏科技云报道

    之后,“存”上位

    芯片的摩尔定律逐渐逼近物理极限,存开始从幕后走向台前,成为AI领域下一个关键赛点。 长期以来,伴随企业数字化转型所建设的“烟囱式”AI基础设施各自为战,数据奔流,价值却困于“堰塞湖”。 存中心作为新型的数据基础设施,正成为AI时代数据流通和融合应用的破题关键。 AI时代的 “数据决定论” AI技术的发展离不开三大要素:数据、算法和。 作为AI时代的“燃料”,数据若存不下、用不好,再强的也如同无米之炊。 正如华为公司副总裁周跃峰所言,我国迈向数据强国的进程中,其关键已超越数据规模的单纯积累,转向对数据质量的深度聚焦。 在训练方面,高性能并行文件系统可以提升大模型训练效率,超大带宽和容量支持超万卡集群无瓶颈扩展,EB级扩展能力适应海量数据,加速卡直通技术使数据从存储到“一跳直达”。 构建AI时代新型 “数据粮仓” 与聚焦在“”不同,数据存聚焦在“数”和“存”,是数据生产要素处理的综合能力体现,肩负着为数字经济各种场景提供源源不断的“生产资料”的使命。

    40200编辑于 2025-06-19
  • 来自专栏腾讯云服务器团队的专栏

    独家支持|腾讯“开悟”AI大赛启动

    “开悟” AI 开放研究平台依托于腾讯太极机器学习平台,基于平台拥有的算法、、脱敏数据等资源优势,为学术研究人员和算法开发者开放国际一流的研究与应用探索平台。 换句话说,攻克多智能体强化学习方法,即有望帮助 AI 解决真实世界的复杂问题,例如城市/空中交通管理、多机器人协调、能源分配等。 与此同时,AI 学界持续面临面四大要素的挑战:算法、数据、、场景。 以强化学习为例子,每个要素都有很多挑战,比如研究场景稀缺,没有数据,算法测试困难到昂贵等。 、评估工具、腾讯云计算的支持等,帮助参赛者开发、测试和提升 AI 在复杂环境中的多维度决策水平。 作为参赛队伍指导老师,电子科技大学谢宁教授表示:“开悟平台提供游戏 AI 框架、强化学习算法框架及基础等资源/服务,解决了我们 AI 教育中面临的 AI 应用与实训平台的缺口。

    1.3K50发布于 2021-08-19
  • 美国AI新基建是“泡沫”吗?

    行业对当前AI领域循环投资的质疑AI是否有真需求?要看AI基建是否有泡沫,首当其冲的问题就是看市场是否有足够的需求,去支撑数百万卡甚至更大规模的数据中心建设。 Sam Altman认为,基于当前观察到的 AI 使用趋势及用户需求规模, OpenAI面临不足的风险,远比过剩更为严峻且更可能发生。 11月1日,Sam Altman和微软CEO纳德拉在共同接受的访谈中表示,过去一年Open AI已经扩展了 10 倍,但如果再拥有10倍的,收入几乎能增10倍。 如即将推出的企业级服务、新型消费设备和机器人等,探索更直接向企业和个人用户出售资源,开启AI云服务。 未来几年,美国AI的故事,也许不只是“泡沫”的故事,更是一次关于生产新边界的集体试验。

    40010编辑于 2025-11-25
  • 来自专栏AI科技大本营的专栏

    从最强AI到“元脑”2.0,智加速产业变革

    作者 | Just 出品 | AI科技大本营(ID:rgznai100) AI模型的数据量、结构的复杂程度不断增加,带来了大规模AI的庞大需求。 要让这些模型有效有效运转需要AI芯片和AI服务器。 据浪潮估计,2020年,以GPU为代表的AI加速芯片所交付的已经超过同类CPU,预计到2025年,AI加速芯片所提供的可能在超过80%。 总之,向着高、高可扩展性、高性价比的目标,浪潮已推出的AI计算产品阵列可以全方位地满足不同训练和推理场景的需求。 比如,荣联科技、趋动科技、浪潮携手助力西湖大学智中心建设,是一个“AI配置+AI集群优化+实施运维能力”的顶级智中心方案交付配置。 同时,通过将浪潮的AIstation AI集群调度系统与趋动科技的OrionX AI池化加速方案进行无缝的融合,对AI和应用负载进行精细化管理,提升50%AI算法开发部署效率,提升5倍以上的AI

    57720编辑于 2023-05-08
  • 来自专栏数据猿

    WAIC看智能演进:之后,存接棒AI基建

    问题的根源,已经不仅仅是“不够”,更是“存卡住”。 这是AI系统的隐形短板,也是决定大模型能否快速大规模落地的核心基础设施问题。 而本次WAIC的发布,正是AI新基建路线图中,“存”走向台前、跃升为战略资源的重要标志。 之后,存加入“AI地基”阵营 过去几年,AI系统基础设施的关键词几乎可以用四个字总结:“加卡扩机”。 曙光存储副总裁张新凤指出:“GPU在等数据”,而不是“数据在等GPU”,已经成为大量AI集群运行时的普遍现象。初步测算表明:每增加1元的“存”支出,可为AI系统节省10元的开销。 趋势二:大模型对“数据流速”提出极致要求 在实际训练中,AI集群规模动辄成百上千张卡,如果存储系统性能不足,就会出现“GPU排队等数据”的尴尬局面。 首批部署于长三角、成渝、内蒙古、贵州等国家级枢纽,覆盖7大存资源池,支持8类主流AI芯片架构,并高度契合“东数西”“全国一体化”国家战略。

    21110编辑于 2025-10-21
领券